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面 问 光 伏 项 目 投资 风险 的 大 数据 监测 指标 


最 选 研究 


一 以 Solarbao 平台 为 例 
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摘要 : [ 目的 ] 在 构建 光伏 项 目 投资 风险 监测 模型 的 过 程 中 , 为 了 甄选 面向 互联 网 金融 平台 的 大 数据 应 用 监测 指 
标 ， 尝 试 提出 系统 的 甄选 方案 并 结合 实际 案例 进行 验证 。[ 方法 】 应 用 大 数据 监测 模型 ， 整合 Solarbao 平台 多 源 
异 构 数据 ,以 专家 判断 为 项 目 投资 风险 分 析 依据 , 运用 CHAD 决策 树 归 纳 多 维 监测 指标 组 合 , 并 运用 R-Q 型 因 
子 分 析 方法 提炼 识别 投资 风险 的 关键 指标 。[ 结果 ] 得 到 8 条 监测 光伏 项 目 投资 风险 的 指标 组 合 和 10 项 识别 投 
资 风险 的 关键 指标 。[ 局 限 ] R-Q 型 因子 分 析 中 的 专业 指标 有 待 进一步 细 分 并 形成 动态 更 新 机 制 。[ 结论 ] GR 
选 方案 能 够 满足 大 数据 监测 模型 对 指标 采集 的 要 求 ， 对 投资 者 评估 光伏 项 目 风 险 、 平 台 筛 选 合适 项 目 以 及 监管 


部 门 排查 该 领域 系统 性 风险 具有 借鉴 意义 。 
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随 着 中 国 能 源 互联 网 国家 战略 的 实施 ， 以 及 电力 
工业 绿色 转型 方案 的 逐步 出 台 ,， 电力 系统 在 新 能 源 、 
新 材料 、 新 储 能 技术 等 方面 将 加 大 科技 创新 和 资金 投 
入 力度 , 促进 电力 工业 绿色 转型 和 低 碳 发 展 趾 ,光伏 发 
电 项 目 作为 新 能 源 发 电 产 业 的 新 生 力 量 , HU CR 
声 、 无 污染 、 安全 可 靠 等 优点 。 但 因 其 发 电 成 本 高 , OC 
电 转 换 效 率 和 能 量 密度 低 ， 且 受气 候 环境 影响 大 等 特 


m 


力 新 能 源 项 目的 融资 渠道 正 逐 渐 转 向 社会 资本 ,并 促 
成 电力 新 能 源 领域 互联 网 金融 平台 的 相继 产生 和 快速 
Ag, 

该 领域 互联 网 金融 平台 的 快速 发 展 促进 了 光伏 项 
目 资金 融通 的 效率 , 但 其 背后 积累 的 融资 主体 信用 风 
险 也 日 趋 显现 四。 平台 中 资信 状况 较 差 的 光伏 项 目 一 
且 发 生 债务 违约 ,将 造成 投资 者 严重 的 经 济 损失 
同时 ,由 于 平台 融合 了 金融 行业 和 互联 网 行业 的 高 风 
险 属性 , 项 目 发 生 违约 后 ， 其 风险 扩散 速度 更 快捷 、 交 


APL 导致 项 目 投资 风险 偏 高 ,在 大 规模 推广 和 向 传 
统 金融 机 构 融资 的 过 程 中 遇 到 了 诸多 阻力 串 。 为 此 , 电 


叉 传染 更 严重 , 平台 的 整体 投资 风险 将 随 之 上 升 中 , 
进而 会 影响 该 领域 互联 网 金融 体系 的 安全 稳定 。 因此， 
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究 ”( 项 目 编号 : 2015-XXRJ-001) 和 中 国 经 济 改革 人 研究 基金 会 课题 “互联 网 金融 的 风险 与 监管 制度 研究 ”的 研究 成 果 之 一 。 
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加 强 光 伏 项 目 投资 风险 监测 成 为 推进 该 领域 互联 网 金 
融 持 续 健 康 发 展 的 客观 需要 和 当务之急 。 

面 对 海 量 、 与 日 俱 增 和 多 源 异 构 的 风险 关联 数据 ， 
传统 风险 监测 模型 缺乏 实时 捕 提 、 管 理 和 处 理 相应 数 
据 的 能 力 , 需要 借助 大 数据 技术 进行 改进 , 实现 多 源 
异 构 数 据 提取 、 存 储 和 多 条 件 快速 组 合 查询 技术 门 ， 形 
成 光伏 项 目 投 资 风险 大 数据 监测 模型 。 由 于 光伏 项 目 
投资 风险 的 构成 较为 复杂 , 不 仅 要 借助 关键 指标 ， 还 
要 通过 综合 多 个 指标 和 特征 参量 形成 风险 判断 
并 且 平 台数 据 的 非 结构 化 特点 要 求 监 测 模型 不 能 采用 
固定 不 变 的 指标 ,而 是 需要 根据 平台 实际 发 布 的 融资 
信息 科学 制定 出 反映 项 目 投资 风险 的 监测 指标 。 因 此 ， 
合适 的 监测 指标 甄选 方案 有 待 被 提出 ,这 也 是 构建 大 
数据 监测 模型 的 核心 难点 。 

本 研究 基于 Solarbao 平 台 "， 尝试 提出 面向 光伏 项 
目 投资 风险 的 大 数据 监测 指标 甄选 方案 。 在 整合 
Solarbao 平台 多 源 异 构 数 据 的 基础 上 ， 以 专家 判断 为 项 
目 投资 风险 分 析 的 依据 , 运用 CHAD 决策 树 归纳 多 维 
监测 指标 组 合 , 并 运用 R-Q 型 因子 分 析 方 法 提炼 识别 
投资 风险 的 关键 指标 ,以 满足 光伏 项 目 投资 风险 大 数 
据 监测 模型 对 指标 采集 的 要 求 。 研 究 的 创新 之 处 在 于 : 

(1) 提出 甄选 线 上 光伏 项 目 投资 风险 监测 指标 的 
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系统 方案 ; 

(D) 编制 应 用 于 提炼 多 维 监测 指标 组 合 和 关键 指 
标的 调查 问卷 样 例 ; 

(3) 基于 平台 多 源 异 构 数据 , 构建 符合 大 数据 监 
测 模 型 指标 采集 要 求 的 实验 指标 ; 

(4) 采取 的 数据 挖掘 应 用 技术 具备 提炼 风险 判断 、 
处 理 多 维 数据 的 能 力 , 并 且 模型 输出 结果 易于 解释 。 


2 光伏 项 目 投资 风险 大 数据 监测 模型 的 构建 


大 数据 监测 模型 的 应 用 环境 是 甄选 监测 指标 的 重 
要 基础 (1 本 研究 以 Solarbao 平台 作为 监测 模型 的 应 
用 环境 。Solarbao 平台 是 以 实物 融资 租赁 为 商业 模式 
的 互联 网 创新 金融 服务 平台 , 因 其 专门 从 事 光 伏 项 目 
融资 租赁 是 平台 中 投资 项 目 众多 , 故 选 择 该 平台 进行 
研究 。 该 平台 兼 具 众 筹 和 融资 租赁 的 特点 , 投资 者 通 
过 平台 购买 太阳 能 电池 板 , 并 将 电池 板 委托 融资 租赁 
公司 出 租 给 发 电 企业 使 用 ,发 电 企业 用 发 电 所 得 电费 
和 政府 补贴 支付 使 用 电池 板 的 租金 。 在 整个 过 程 中 ， 
客户 无 须 接 触 到 太阳 能 电池 板 , 所 得 的 回报 是 分 期 拿 
到 的 租金 ， 即 先期 投入 资金 , 后 期 获取 收益 , 平台 因 
此 具有 了 互联 网 金融 的 属性 。 光 伏 项 目 投资 风险 大 数 
据 监测 模型 应 用 环境 如 图 1 所 示 : 
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图 1 光伏 项 目 投资 风险 大 数据 监测 模型 应 用 环境 


CDhttp://www.solarbao.com/. 


现代 图 书 情报 技术 


由 图 1 可 知 , Solarbao 平台 是 光伏 项 目 和 投资 者 之 
间 的 信息 媒介 , 融资 标的 信息 、 光 伏 电站 运营 商 信 息 、 
光伏 电站 经 营 状况 、 政 府 补 贴 情况 等 将 通过 平台 对 外 
展示 , 揭示 该 光伏 项 目 开 展 融 资 和 后 期 运营 的 基本 条 
件 ,为 光伏 项 目 投资 风险 监测 指标 甄选 提供 依据 ,也 
形成 了 大 数据 监测 模型 的 数据 基础 。 光 伏 项 目 投资 风 
今 大 数据 监测 模型 如 图 2 所 示 : 
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图 2 光伏 项 目 投 资 风 险 大 数据 监测 模型 


由 图 2 可 知 , 该 模型 具有 分 层 信息 聚合 架构 ， 基 
于 此 架构 进行 光伏 项 目 投资 风险 监测 包含 4 个 步骤 : 

(1) 数据 提取 和 预 处理 。 运 用 基于 GoldenGate 的 
多 源 异 构 数 据 提取 方法 "~"， 从 平台 在 线 日 志 中 实时 抓 
取 数 据 ， 并 将 其 保存 在 Trail 格式 的 文件 中 ; 数据 遗 
漏 、 出 现 异 常 值 等 问题 也 在 该 步 又 中 进行 处 理 。 

(2) 数据 级 聚合 。 利 用 Hadoop 的 MapReduce 并 
行 计算 框架 加 速 装 载 抽 取出 的 数据 59， 该 框架 自动 对 
数据 进行 汇聚 和 排序 , 将 最 终结 果 输 出 到 SQL Server 
数据 库 和 信息 辅助 系统 中 ， MapReduce 并 行 计 算 框 架 
提升 了 数据 装载 速度 ,为 大 数据 监测 模型 实时 、 动 态 
获取 数据 提供 技术 保障 。 

(3) 信息 级 聚合 。 运 用 数据 挖掘 技术 实时 、 动 态 
王选 光伏 项 目 投资 风险 监测 指标 , 呈现 风险 监测 指标 
的 多 维 关联 和 关键 特征 ， 并 提出 与 特定 风险 类 型 进 
行 相似 度 匹 配 的 方案 。 以 往 研 究 中 关于 项 目 风险 判 
断 的 数据 挖掘 技术 主要 包括 关联 规则 ”7 站、 Kano 模 
型 41 下 、Kansei 工程 90、CHAID 决策 树 0758、R-Q 
型 因子 分 析 等 ("各 数据 挖掘 技术 的 特点 比较 如 表 
1 所 示 。 
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R1 数据 挖掘 技术 特点 比较 


提炼 风险 判断 “不 能 有 限 能 能 能 
提取 风险 偏好 ”能 能 不 能 不 能 能 
处 理 多 维 数据 ”能 能 不 能 能 能 
解释 的 复杂 度 ”高 低 高 低 低 


由 表 1 可 知 , 关联 规则 不 适用 于 提 炬 风险 判断 且 
模型 解释 的 复杂 度 较 高 ; Kano 模型 更 侧重 于 提取 客户 
对 项 目 风 险 的 偏好 ; Kansei 工程 缺乏 处 理 多 维 数据 的 
能 力 ; CHAID 决策 树 和 R-Q 型 因子 分 析 则 相对 适用 ， 
可 将 专家 判断 作为 项 目 投资 风 险 分 析 的 依据 , 运用 
CHAID 决策 树 实时 、 动 态 归纳 多 维 监 测 指标 组 合并 
运用 R-Q 型 因子 分 析 方 法 实时 、 动 态 提 炼 识别 投资 风 
险 的 关键 指标 。 

HBase 具备 分 布 式 并 发 处 理 效率 高 、 易 扩展 、 动 
态 伸缩 的 特征 5 因此 本 研究 将 数据 挖掘 的 基础 数据 
以 一 维 或 多 维 形式 存储 于 Hbase 中 , 一 方面 支持 数据 
挖掘 引 警 实时、 动态 分 析 数 据 , 另 一 方面 响应 数据 监 
测 中 多 条 件 快 速 组 合 查询 的 需求 ; 并 通过 Hive 对 基础 
数据 进行 备份 , 便于 后 期 离线 计算 和 指标 优化 。 

(4) 决策 级 聚合 。 为 HBase 中 监测 指标 建立 索引 机 
制 ,在 数据 导入 时 即 通过 索引 引擎 实现 对 监测 数据 低 
延迟 、 动 态 地 提取 , 进而 通过 Jion 引擎 建立 风险 类 型 与 
跨 表 数据 的 映射 关系 ,对 光伏 项 目 投资 风险 进行 实时 
监测 。 基 于 以 上 步骤 , 本 研究 建立 大 数据 应 用 监测 模型 ， 
该 模型 的 监测 过 程 是 动态 的 ,监测 结果 是 实时 的 。 


3 ”大 数据 监测 指标 甄选 方案 设计 


3.1 运用 CHAID 决策 树 归 纳 多 维 监 测 指标 组 合 的 
方案 设计 

CHAID 决策 树 (CHi-square Automatic Interaction 
Detection Decision Tree) 具 有 监督 式 的 特征 茜 取 与 描述 
功能 , 其 基本 思想 是 从 训练 数据 集中 自发 地 构造 决策 
规则 , 进而 对 其 他 数据 集 进行 分 类 。 决 策 树 中 的 每 个 
非 叶 子 节点 代表 一 个 特征 属性 ， 每 个 分 枝 表 示 这 个 特 
征 属性 的 输出 值 ， 每 个 叶子 节点 储存 一 个 类 别 。 规 则 
的 形成 是 从 根 节点 开始 ， 对 待 分 类 项 的 特征 属性 进行 
测试 , 并 按照 CHAD 算法 的 卡 方 检验 结果 选择 分 支 ， 
一 直到 达 叶 子 节 点 , 最 后 将 叶子 节点 储存 的 类 别 作为 


一 


XIANDAI TUSHU QINGBAO JISHU 


201711.02021v1 


chinaXiv 


决策 结果 。 由 于 CHAID 算法 是 以 卡 方 检验 结果 作为 
分 枝 准 则 ,因此 不 用 考虑 决策 树 修剪 中 ]。 

以 Solarbao 平台 光伏 项 目 基本 信息 为 基础 ,本 研 
究 通 过 CHAID 决策 树 实 时 、 动 态 地 归纳 多 维 监测 指 
标 组 合 。 根 据 图 3, 基本 信息 指 Solarbao 平台 可 投资 项 
目 列表 界面 中 的 项 目 信 息 。 本 研究 定义 其 为 基本 指标 ， 
包含 投资 该 项 目的 年 化 收益 、 产 品 单价 、 投 资 锁定 期 
和 返还 利息 方式 。 


ER BHO BUF eue 
243585 

6.80 % 16.807/# 90x Ed 

E 产品 单价 duck 返 四 方式 BE 
263575 

6.30 % 16.80 元 片 60x ARETES 

年 化 收益 产品 单价 锁定 期 返 租 方式 立即 购买 
ES ELISS 肉 蒙古 阿拉 善 盟 智 伟 30MWp 光 伏 发 电 项 目 投产 运营 
7.10 % 2000.00: 90x 每 月 15 日 ， 按 月 返 租 = 

年 化 收益 产品 单价 锁定 期 返 租 方式 立即 赂 买 
35210758 甘肃 张掖 “ 临 泽 且 工业 西区 6MW 需 目 工程 实施 及 验收 
7.10 % 22000.00x/ 90x 每 月 15 日 ， 按 月 返 租 

年 化 收益 产品 单价 锁定 期 返 租 方式 立即 赂 买 


图 3 Solarbao 平台 光伏 项 目 基本 信息 示例 
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每 个 基本 指标 包含 2 类 属性 , 代表 决策 树 分 支 ; 
项 目 投资 风险 类 型 表示 叶子 节点 ,包含 低 风险 型 、 中 
等 风险 型 和 高 风险 型 ， 如 表 2 所 示 : 


K2 基本 指标 及 属性 


基本 指标 基本 指标 属性 
(K1) 年 化 收益 Me 

(K2) 产 品 单价 n t 
(K4) 返 还 利息 方式 Pe 


表 3 是 光伏 项 目 投资 风险 专家 判断 A 问 卷 的 样 例 ， 
问卷 结果 将 被 用 于 归纳 多 维 监 测 指标 组 合 。 受 访 专 家 
若 认为 一 个 年 化 收益 不 高 于 7%、 产 品 单价 不 高 于 
2 000 元 、 投 资 锁定 期 不 超过 90 天 、 返 还 利息 方式 为 
到 期 返 本 返 息 的 光伏 项 目 为 低 风 险 型 , 则 可 在 问卷 中 
填写 “LR”。 


表 3 Solarbao 平台 光伏 项 目 投资 风险 专家 判断 A 问卷 


编号 年 化 收益 产品 单价 投资 锁定 期 返还 利息 方式 项 目 投 资 风 险 类 别 判断 
1 <7% < 2000 元 <90 天 到 期 返 本 返 息 LR 
2 >7% < 2000 元 >90 K 按 月 返 息 MR 
3 x 796 7200036 x90 X 到 期 返 本 返 息 LR 
4 >7% 7200076 x90 X 到 期 返 本 返 息 HR 
5 <7% < 2000 元 >90 K 到 期 返 本 返 息 LR 
6 >7% 7200076 x90 X 按 月 返 息 MR 
7 x 796 7200036 >90 K 到 期 返 本 返 息 MR 
8 <7% 之 2000 元 >90 天 按 月 返 息 LR 
9 >7% x 2000 元 x90 X 到 期 返 本 返 息 MR 
10 >7% 72000 JÈ >90 K 按 月 返 息 HR 
11 <7% < 2000 元 <90 天 按 月 返 息 LR 
12 x 796 x 2000 元 >90 K 按 月 返 息 LR 
13 >7% < 2000 元 >90 天 到 期 返 本 返 息 HR 
14 <7% 7200076 x90 X 按 月 返 息 MR 
15 >7% 7200076 >90 K 到 期 返 本 返 息 HR 
16 >7% < 2000 元 <90 天 按 月 返 息 LR 
QE: LR 为 低 风险 型 ; MR 为 中 等 风险 型 ; HR 为 高 风险 型 。“ 到 期 返 本 返 息 ” 是 指 在 项 目 投资 到 期 时 返还 投资 者 本 金 和 全 部 利息 ;“ 按 月 返 


息 ” 是 指 在 项 目 投资 存续 期 内 每 月 返还 投资 者 当月 利息 。) 

3.2 ”运用 R-Q 型 因子 分 析 提 炼 关键 监测 指标 的 方案 
设计 

R-Q 型 因子 分 析 (R-Q Mode Factor Analysis) 是 R 
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型 和 Q 型 因子 分 析 相 结合 的 一 种 多 元 统计 分 析 方 法 ， 
由 于 及 型 因子 分 析 和 Q 型 因子 分 析 具 有 对 偶 关 系 ， 
此 变量 点 和 样品 点 可 投影 于 同一 因子 空间 ， 且 样品 点 
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的 类 型 能 方便 地 被 邻近 的 变量 点 来 解释 。 两 类 因子 分 
析 之 间 存 在 的 对 偶 关系 在 数学 上 已 经 被 证 明 哺 0， 则 
通过 正 交 变换 即 可 从 R 型 结果 中 推 得 Q 型 结果 ， 其 数 
学 处 理 过 程 就 是 对 应 分 析 (Correspondence Analysis); 在 
同一 标 度 的 因子 空间 里 ,对 应 分 析 图 形 上 样本 点 与 变 
量 点 的 邻近 程度 表示 该 变量 因子 对 样本 的 解释 程度 。 

以 Solarbao 平台 光伏 项 目 基 本 信息 和 专业 信息 为 
基础 ,本 研究 运用 R-Q 型 因子 分 析 实 时 、 动 态 地 提炼 
识别 项 目 投 资 风险 的 关键 指标 。 在 图 4 示例 中 , 专业 
言 息 是 指点 击 Solarbao 平台 可 投资 项 目 列表 中 任 一 家 
项 目 后 出 现 的 融资 信息 , 本 研究 定义 其 为 专业 指标 ， 
包括 光伏 项 目 运 营 商 信息 、 项 目 建 设 进 度 表 、 相 关 资 
质 、 项 目 安全 保障 情况 等 ; 变量 点 由 上 述 基本 指标 和 
专业 指标 共同 组 成 , 如 表 4 所 示 。 


项 目 简介 收益 说 明 


相关 资质 安全 保障 相关 问题 


承租 人 介绍 


GBA RES RR 


所 需 租赁 物 信息 及 数量 
承租 人 租金 支付 方式 


融资 租赁 期 限 016.0 
租赁 物 所 有 权 的 转移 方式 | 承租 人 到 期 回 购 
担保 方式 pe 


图 4 Solarbao 平台 光伏 项 目 专业 信息 示例 
表 4 基本 指标 、 专 业 指 标 及 属性 


专业 指标 专业 指标 属性 
(A1) 投资 年 化 收益 较 高 >7% 
(A2) 融资 产品 单价 较 高 72000 元 
(A3) 投资 锁定 期 较 长 >90 K 
(A4) 返还 利息 频率 较 高 按 月 或 季度 返 息 
(A5) 项 目 总 投资 期 较 长 >2 年 
(A6) 总 体 融 资 规模 较 大 >100 万 
(A7) 承租 企业 成 立 年 限 较 长 >3 年 
(A8) 承租 企业 公布 的 资质 、 合 同 齐全 ”公开 了 资质 和 合同 复印 件 
(A9) 设备 技术 较为 先进 光电 转化 率 >>25% 


(A10) 项 目 存 续 期 预计 年 均 发 电量 较 大 二 1000 HEE 
(A11) 度 电 补贴 占 售 电价 比重 较 大 >70% 
(A12) 项 目 公布 的 实地 照片 较 丰 富 二 3 张 
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样本 点 即 项 目 投资 风险 类 型 , 包括 低 风 险 型 、 中 等 
风险 型 和 高 风险 型 ; 表 5 是 光伏 项 目 投资 风险 专家 判断 
B 问卷 的 样 例 , 问卷 结果 将 被 用 于 炼 识别 项 目 投资 风 
险 的 关键 指标 。 受 访 专 家 若 认 为 Al 指标 “投资 年 化 收 
益 较 高 ”符合 中 等 风险 型 和 高 风险 型 光伏 项 目的 特点 ， 
则 可 在 对 应 的 选项 中 打 勾 。 

表 5 Solarbao 平台 光伏 项 目 投资 风险 专家 判断 B 问卷 


评价 项 目 投资 风险 类 型 指标 低 风险 中 等 风险 高 风险 


Al 投资 年 化 收益 较 高 4 4 
A2 融资 产品 单价 较 高 Y 

A3 ”投资 锁定 期 较 长 J 
A4 ”返还 利息 频率 较 高 y y 

AS 项 目 总 投资 期 较 长 4 4 
A6 总体 融 资 规模 较 大 y 

A7 承租 公司 成 立 年 限 较 长 V 

A8 承租 公司 公布 的 资质 较 齐 全 v 4 

A9 设备 技术 较为 先进 4 
A10 项 目 存续 期 年 均 发 电量 较 大 J 4 

Al» 度 电 补贴 占 售 电价 比重 较 大 V 

AI2 项 目 公 布 的 实地 照片 丰富 v y 


QE: “投资 锁定 期 "是 指 投资 者 在 确认 投资 后 不 得 向 第 三 方 转让 
投资 份额 的 期 限 ;“ 承 租 公司 公布 的 资质 "包括 公司 营业 执照 、 税 务 
登记 证 、 银 行 开户 许可 证 、 机 构 信用 代码 证 、 投 资 项 目 备案 证 等 。) 

在 进行 问卷 调查 时 , 车 电力 领域 专家 对 问卷 A 和 
问卷 B 中 专业 金融 术语 存在 内 涵 理 解困 难 , 问卷 发 放 
人 员 将 向 其 进行 详细 解释 ， 以 确保 电力 领域 专家 对 相 
关 术 语 理解 的 准确 度 。 基 于 问卷 调查 ,本 文 获取 专家 
对 项 目 投资 风险 的 判断 结果 和 统计 数据 , 并 在 此 基础 
上 采用 CHAID 决策 树 和 R-Q 型 因子 分 析 对 数据 进行 
分 析 ， 从 专家 判断 中 提炼 监测 光伏 项 目 投资 风险 的 多 
维 监测 指标 组 合 和 关键 指标 ,为 项 目 投资 风险 大 数据 
监测 指标 甄选 提供 支持 。 


4 实证 分 析 与 结果 讨论 


共 向 受 访 专家 "发 放 了 85 份 A 问卷 和 32 份 B 问 
卷 。 回 收 有 效 问卷 A 68 份 , 有 效 问卷 回收 率 为 8096, 
因 每 份 A 问卷 包含 16 个 判断 结果 , 故 CHAID 决策 树 
建 模样 本 的 数量 为 1 088 个 ; 回收 有 效 问卷 B 30 份 ， 
有 效 问卷 回收 率 约 为 93.8%， 因 每 份 B 问卷 包含 12 个 


中 受 访 专家 指 在 金融 领域 和 电力 领域 工作 6 年 以 上 或 拥有 相关 领域 博士 学 位 的 专业 学 者 。 
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判断 结果 , 故 R-Q 型 因子 分 析 的 样本 数量 为 360 个 。 
4.1 基于 CHAID 决策 树 归 纳 多 维 监测 指标 组 合 
CHAID 决策 树 的 总 体 分 类 正确 率 为 66.9%， 其 中 ， 


低 风 险 型 项 目 分 类 正确 率 为 84.2%, 中 等 风险 型 项 目 
分 类 正确 率 为 45%, 高 风险 型 项 目 分 类 正确 率 为 
70.296, 该 决策 树 共 产生 8 条 决策 规则 ， 如 表 6 所 示 : 


表 6 CHAID 决策 树 输 出 规则 


先行 条 件 (if) 


编号 结果 (then) 
年 化 收益 品 单价 投资 锁定 期 返还 利息 方式 
1 <7% < 2000 元 或 >2000 元 x90 天 按 月 返 息 氏 风 险 型 (89.0%0) 
2 >7% 之 2000 元 >90 天 到 期 返 本 返 息 或 按 月 返 息 高 风险 型 (77.9%) 
3 <7% < 2000 元 或 >2000 元 <90 天 到 期 返 本 返 息 氏 风 险 型 (69.6%) 
4 二 7% «2000 元 >90 K 到 期 返 本 返 息 或 按 月 返 息 中 等 风险 型 (69.4%) 
5 <7% < 2000 元 或 >2000 元 >90 K 按 月 返 息 氏 风 险 型 (65.4%) 
6 L796 72000 元 x90 X 到 期 返 本 返 息 或 按 月 返 息 中 等 风险 型 (63.2%) 
7 >7% 三 2000 元 <90 天 到 期 返 本 返 息 或 按 月 返 息 氏 风 险 型 (62.0%0) 
8 <7% < 2000 75 3X — 2000 元 >90 K 到 期 返 本 返 息 高 风险 型 (39.7%) 
ER 6 中 , 8 条 决策 规则 的 表述 方式 是 “if-then” ”规则 中 , 各 投资 风险 类 型 可 由 4 个 监测 指标 表征 ， 


形式 。 例 如 , 第 1 条 决策 规则 表示 : 若 光 伏 发 电 项 
目的 年 化 收益 不 高 于 7%、 产 品 单价 不 高 于 2000 
元 (或 高 于 2 000 元 )、 投 资 锁定 期 不 超过 90 天 、 返 
还 利息 方式 为 按 月 返 息 , 该 项 目 被 认为 是 低 风 险 
型 ; 第 2 条 决策 规则 表示 : 车 光伏 发 电 项 目的 年 化 
收益 高 于 7%、 产 品 单价 高 于 2 000 元 、 投 资 锁定 
期 超过 90 天 、 返 还 利息 方式 为 到 期 返 本 返 息 ( 或 按 
月 返 息 )， 则 该 项 目 被 认为 是 高 风险 型 。 在 以 上 决策 


故 本 研究 基于 CHAID 决策 树 得 到 8 条 多 维 监 测 指 
标 组合 。 
4.0 ”基于 R-Q 型 因子 分 析 提 炼 关键 监测 指标 

表 7 是 B 问卷 的 专家 判断 汇总 结果 和 R-Q 型 因子 
分 析 结 果 。 专 家 判断 汇总 结果 是 指 各 指标 对 应 项 目 投 
资 风险 类 型 被 专家 勾 选 的 数量 占 回 收 问卷 总 数 的 百 分 
比 ; R-Q 型 因子 分 析 结 果 是 指 监 测 指 标 与 项 目 投资 风 
险 类 型 的 相关 度 统计 , 用 卡 方 值 衡量 。 


表 7 专家 判断 汇总 结果 与 R-Q 型 因子 分 析 结 果 
mom 专家 判断 汇总 结果 R-Q 型 因子 分 析 结 果 ( 卡 方 值 ) 
低 风险 型 中 等 风险 型 高 风险 型 低 风 险 型 中 等 风险 型 高 风险 型 
Al 21.9% 46.9% 87.5% -3.3 -0.3 3.7 
A2 12.5% 40.6% 75.0% -3.6 0.0 3.7 
A3 18.8% 56.3% 78.1% -3.6 0.8 2.9 
A4 81.3% 46.9% 21.9% 2.8 -0.1 -2.8 
A5 21.9% 40.6% 65.6% -2.6 0.0 2.6 
A6 40.6% 50.0% 59.4% -1.3 0.2 1.1 
A7 75.0% 40.6% 28.1% 2.5 -0.6 -2.0 
A8 71.9% 43.8% 25.0% 2 -0.1 -2.2 
A9 37.5% 53.1% 65.6% -1.8 0.3 1.5 
A10 65.6% 46.9% 15.6% 24 0.9 -3.0 
AI 84.496 34.4% 12.5% 4.1 -0.8 -3.3 
A12 75.0% 43.8% 25.0% 2.5 -0.2 -2.3 
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基于 R-Q 型 因子 分 析 结 果 , 项 目 投资 风险 类 型 与 监 
测 指 标 对 应 分 析 图 如 图 5 所 示 : 


Ai 风险 类 型 
o: Welles 
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低 风险 型 
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图 5 项 目 投资 风险 类 型 与 监测 指标 对 应 分 析 


(1). 低 风险 型 项 目 与 A4、A7、A8、A10、A11 和 
A12 指标 组 成 第 一 类 聚 类 ,说 明 若 项 目 返还 利息 频率 
较 高 、 承 租 公司 成 立 年 限 较 长 、 承 租 公 司 公布 的 资质 
较 齐 全 、 项 目 存续 期 年 均 发 电量 较 大 、 度 电 补 贴 占 售 
电价 比重 较 大 、 公 布 的 实地 照片 丰富 , 则 该 项 目 属于 
低 风险 型 ; 

(2) 高 风险 项 目 与 A1、A2、A3 和 AS 指标 组 成 第 
TARK, 说 明 若 项 目 投资 年 化 收益 较 高 、 融 资产 品 
单价 较 高 、 投 资 锁定 期 较 长 、 项 目 总 投资 期 较 长 ， 则 
该 项 目 属于 高 风险 型 。 

(3) 在 中 等 风险 型 项 目 风 险 判 断 方面 , 根据 卡 方 
统计 显著 性 , A3 和 A10 指标 对 应 于 中 等 风险 型 的 卡 方 
值 分 别 为 0.8 和 0.9, A6 和 A9 指标 对 应 于 中 等 风险 型 
的 卡 方 值 也 为 正 ， 故 本 研究 将 这 4 项 指标 归 为 中 等 风 
险 型 项 目的 辅助 监测 指标 。 

总 结 以 上 结果 还 可 以 发 现 : 

(1) 若 项 目 投资 年 化 收益 较 高 、 融 资产 品 单价 较 
高 .投资 锁定 期 较 长 ， 则 该 项 目 被 认为 具有 高 风险 ， 这 
与 CHAID 决策 树 归 纳 的 第 2 条 决策 规则 相符 ; 

(2) 若 项 目 返还 利息 频率 较 高 , 则 该 项 目 被 认为 
属于 低 风 险 型 ， 这 与 CHAID 决策 树 归 纳 的 第 1 和 第 5 
条 规则 相符 。 这 说 明 CHAID 决策 树 模型 实证 结果 中 
有 3 条 规则 在 R-Q 型 因子 分 析 实证 结果 中 得 到 了 验证 ， 
表明 该 琶 选 方案 具有 可 靠 性 。 
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5 结 语 


在 构建 光伏 项 目 投资 风险 监测 模型 的 过 程 中 ， 琶 
选 面向 互联 网 金融 平台 的 大 数据 应 用 监测 指标 是 其 核 
心 难点 。 本 研究 构建 了 实时 动态 监测 光伏 项 目 投资 风 
仿 的 大 数据 监测 模型 ， 为 满足 模型 对 指标 采集 的 要 求 ， 
进而 提出 大 数据 监测 指标 甄选 方案 : 在 整合 Solarbao 
平台 多 源 异 构 数 据 基 础 上 ， 以 专家 判断 为 项 目 投资 风 
险 分 析 依 据 , 运用 CHAID 决策 树 归 纳 多 维 监 测 指标 
组 合 , 并 运用 R-Q 型 因子 分 析 方 法 提炼 识别 投资 风险 
的 关键 指标 ,研究 得 到 8 条 “if-then”* 形 式 的 光伏 项 目 投 
资 风险 监测 指标 组 合 和 10 项 识别 投资 风险 的 关键 指 
标 ， 表 明 该 甄选 方案 具有 可 行 性 ,符合 监测 模型 对 指 
标 采 集 的 要 求 。 在 CHAID 决策 树 模 型 实证 结果 中 有 3 
条 规则 与 R-Q 型 因子 分 析 实 证 结果 实现 了 相互 验证 ， 
表明 该 甄选 方案 具有 可 靠 性 。 研 究 的 局 限 在 于 了 R-Q 型 
因子 分 析 中 的 专业 指标 有 待 进一步 细 分 并 形成 动态 更 
新 机 制 。 

HRT, 电力 新 能 源 领域 互联 网 金融 在 光伏 项 目 融 
资 过 程 中 扮演 着 越 来 越 重要 的 角色 , 但 其 背后 积累 的 
融资 主体 信用 风险 也 不 容 忽视 ,加 强 光 伏 项 目 投资 风 
险 监测 成 为 推进 该 领域 互联 网 金融 持续 健康 发 展 的 客 
观 需要 和 当务之急 。 本 文 所 提出 的 光伏 项 目 投资 风险 
大 数据 监测 指标 甄选 方案 符合 风险 监测 的 实际 应 用 需 
要 , 为 投资 者 评估 光伏 项 目 风险 、 平 台 筛 选 合适 项 目 
以 及 监管 部 门 排查 该 领域 系统 性 风险 提供 了 一 种 手 
E, 具有 理论 意义 和 实践 价值 。 
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Detecting Investment Risks of Photovoltaic Projects with Big Data: 
Case Study of Solarbao.com 
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Abstract: [Objective] This research proposes a selection scheme for the big data application to monitor the Internet 
financial platforms, which is verified by the real world cases. [Methods] First, we adopted a big data model to integrate 
multi-source heterogeneous data from the Solarbao platform. Second, we utilized the CHAID decision tree to 
summarize multi-dimensional monitoring indicators based on analysis of each project's investment risks. Finally, we 
employed the R-Q factor analysis method to extract the key investment risks. [Results] We got 8 indicators to track the 
investment risks, which could be identified by the other 10 indicators for the photovoltaic projects. [Limitations] More 
research needs to be done with indicators of the R-Q factor analysis, which also requires a dynamic update mechanism. 
[Conclusions] The proposed scheme could help investors assess the risks of individual projects and then select the 
appropriate ones. It will also support the risk management work of the regulatory agencies. 
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